Corpus: hye_newscrawl_2011_100K, 5.1.6 Language Fingerprint

Other corpora

Afrikaans
- News
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2007 30K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- South Africa
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
    - 2023 10K
    - 2023 30K
    - 2023 100K
    - 2023 300K
Albanian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Amharic
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Arabic
- News
  - 2005-2009 10K
  - 2005-2009 30K
  - 2005-2009 100K
  - 2005-2009 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Algeria
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Australia
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
- Bahrain
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2017 10K
    - 2017 30K
- COM
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Canada
  - Newscrawl-osian
- Egypt
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- France
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Germany
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Iran
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Iraq
  - Newscrawl-osian
- Jordan
  - Newscrawl-osian
- Lebanon
  - Newscrawl
- Mauritania
  - Newscrawl
    - 2012 10K
    - 2012 30K
- Morocco
  - Newscrawl
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Palestine
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Newscrawl-osian
- Qatar
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
- Russia
  - Newscrawl-osian
- Saudi Arabia
  - Newscrawl-osian
    - 2018 10K
- Sweden
  - Newscrawl-osian
- Syria
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Newscrawl-osian
- Tunisia
  - Newscrawl
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Turkey
  - Newscrawl-osian
- United Arab Emirates
  - News
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- United Kingdom
  - Newscrawl-osian
Aragonese
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Armenian
- News
  - 2019 10K
  - 2020 10K
  - 2020 30K
  - 2021 10K
  - 2021 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Armenia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Assamese
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Asturian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Azerbaijani
- News
  - 2019 10K
  - 2019 30K
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Balinese
- Wikipedia
  - 2021 10K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
Banjar
- Wikipedia
  - 2021 10K
- Indonesia
  - Web
    - 2015 10K
Bashkir
- News
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
- Newscrawl
- Wikipedia
  - 2011 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Basque
- News
  - 2019 10K
  - 2019 30K
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
Bavarian
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Belarusian
- News
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Belarus
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Bengali
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Bangladesh
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Bihari
- Wikipedia
Bikol
- Wikipedia
  - 2016 10K
  - 2018 10K
  - 2021 10K
  - 2021 30K
Bishnupriya
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Bosnian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Breton
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Bulgarian
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Buriat
- Wikipedia
Catalan
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2004 10K
  - 2004 30K
  - 2004 100K
  - 2004 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Andorra
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- COM
  - Web
- European Union
  - Web
Cebuano
- Newscrawl
  - 2011 10K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2011 10K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Central Bikol
- Wikipedia
  - 2011 10K
  - 2014 10K
Central Kurdish
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Chechen
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
Chinese
- News
  - 2007-2009 10K
  - 2007-2009 30K
  - 2007-2009 100K
  - 2007-2009 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- China, People's Republic of
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Macau
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- SIMP
  - News
    - 2009 10K
    - 2009 30K
    - 2009 100K
    - 2009 300K
    - 2010 10K
    - 2010 30K
    - 2010 100K
    - 2010 300K
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- TRAD
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
Chuvash
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
Corsican
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Croatian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Croatia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Czech
- News
  - 2005 10K
  - 2005 30K
  - 2005-2007 10K
  - 2005-2007 30K
  - 2005-2007 100K
  - 2005-2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2012 1M
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 30K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2014 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Danish
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2012 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Denmark
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
- Faroe Islands
  - Web
- Greenland
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Dhivehi
- News
  - 2019 10K
  - 2019 30K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
- Maldives
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Dimli
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Dotyali
- Wikipedia
  - 2018 10K
Dutch
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Aruba
  - Web
    - 2015 10K
    - 2017 10K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Netherlands Antilles
  - Web
    - 2013 10K
- Suriname
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
Eastern Mari
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
Egyptian Arabic
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Emiliano-Romagnolo
- Wikipedia
  - 2016 10K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
English
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
  - 2024 10K
  - 2024 30K
  - 2024 100K
  - 2024 300K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Newscrawl-public
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2012 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- American Samoa
  - Web
    - 2017 10K
    - 2017 30K
- Anguilla
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Antigua and Barbuda
  - Web
    - 2013 10K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
- Ascension
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
- Australia
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Bahamas, The
  - Web
- Barbados
  - Web
    - 2015 10K
    - 2015 30K
- Bermuda
  - Web
- Botswana
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- British Indian Ocean Territory
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Brunei
  - Web
    - 2015 10K
    - 2015 30K
- Canada
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Dominica
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2015 10K
    - 2015 30K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Falkland Islands (Islas Malvinas)
  - Web
    - 2017 10K
- Fiji
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Gambia, The
  - Web
- Germany
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Gibraltar
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Guadeloupe
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Guyana
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Ireland
  - Web
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Kiribati
  - Web
    - 2013 10K
    - 2013 30K
- Montserrat
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
- Namibia
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Nauru
  - Web
    - 2015 10K
    - 2015 30K
- New Zealand
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Niue
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Philippines
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Puerto Rico
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
- Saint Kitts and Nevis
  - Web
    - 2013 10K
    - 2013 30K
- Saint Lucia
  - Web
- Saint Pierre and Miquelon
  - Web
    - 2016 10K
    - 2016 30K
- Saint Vincent and the Grenadines
  - Web
    - 2015 10K
    - 2016 10K
- Seychelles
  - Web
- Singapore
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- South Africa
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- South Georgia & South Sandwich Islands
  - Web
- Thailand
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Turks and Caicos Islands
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- United Kingdom
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
- Zambia
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Zimbabwe
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Erzya
- Wikipedia
  - 2018 10K
  - 2021 10K
Esperanto
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
Estonian
- News
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Estonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
Extremaduran
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Faroese
- News
  - 2020 10K
  - 2020 30K
- Web
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
- Faroe Islands
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Fiji Hindi
- Wikipedia
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Finnish
- News
  - 2005 10K
  - 2005 30K
  - 2005-2007 10K
  - 2005-2007 30K
  - 2005-2007 100K
  - 2005-2007 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
- Sweden
  - Web
    - 2020 10K
    - 2020 30K
French
- News
  - 2002-2005 10K
  - 2002-2005 30K
  - 2002-2005 100K
  - 2002-2005 300K
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2005-2008 10K
  - 2005-2008 30K
  - 2005-2008 100K
  - 2005-2008 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2012 10K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
  - 2024 10K
  - 2024 30K
  - 2024 100K
  - 2024 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl-public
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Belgium
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Benin
  - Web
    - 2013 10K
    - 2015 10K
    - 2017 10K
    - 2017 30K
- Burkina Faso
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Burundi
  - Web
    - 2015 10K
    - 2015 30K
- Cameroon
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Canada
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Congo, (Congo & Kinshasa)
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Cote d'Ivoire (Ivory Coast)
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- France
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- French Polynesia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Gabon
  - Web
    - 2013 10K
    - 2013 30K
- Guadeloupe
  - Web
    - 2014 10K
    - 2014 30K
- Haiti
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Luxembourg
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2012 10K
    - 2012 30K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Madagascar
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Mali
  - Web
- Martinique
  - Web
    - 2016 10K
- Monaco
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- New Caledonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Niger
  - Web
    - 2013 10K
- Reunion
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Rwanda
  - Web
    - 2013 10K
    - 2013 30K
- Senegal
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Switzerland
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Togo
  - Web
    - 2013 10K
- Tuvalu
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Friulian
- Wikipedia
  - 2018 10K
Galician
- Newscrawl
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2011 10K
  - 2011 30K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Ganda
- Newscrawl
  - 2013 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2018 10K
  - 2021 10K
Georgian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Georgia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
German
- News
  - 1995 10K
  - 1995 30K
  - 1995 100K
  - 1995 300K
  - 1996 10K
  - 1996 30K
  - 1996 100K
  - 1996 300K
  - 1997 10K
  - 1997 30K
  - 1997 100K
  - 1997 300K
  - 1998 10K
  - 1998 30K
  - 1998 100K
  - 1998 300K
  - 1999 10K
  - 1999 30K
  - 1999 100K
  - 1999 300K
  - 2000 10K
  - 2000 30K
  - 2000 100K
  - 2000 300K
  - 2001 10K
  - 2001 30K
  - 2001 100K
  - 2001 300K
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2003 10K
  - 2003 30K
  - 2003 100K
  - 2003 300K
  - 2004 10K
  - 2004 30K
  - 2004 100K
  - 2004 300K
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2010 1M
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2012 1M
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
  - 2024 10K
  - 2024 30K
  - 2024 100K
  - 2024 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Newscrawl-public
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2010 1M
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Austria
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Web
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
- Belgium
  - Web
    - 2013 10K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2021 10K
    - 2021 30K
    - 2021 100K
    - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Germany
  - Web
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
    - 2021 10K
    - 2021 30K
    - 2021 100K
    - 2021 300K
- Hungary
  - Web
    - 2013 10K
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
    - 2021 10K
    - 2021 30K
    - 2021 100K
    - 2021 300K
- Liechtenstein
  - Web
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
- Luxembourg
  - Web
    - 2013 10K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
    - 2021 10K
    - 2021 30K
    - 2021 100K
    - 2021 300K
- Namibia
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
  - Web
    - 2013 10K
    - 2013 30K
    - 2017 10K
    - 2017 30K
    - 2019 10K
    - 2019 30K
    - 2019 100K
- Poland
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
- Switzerland
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
Gilaki
- Web
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2016 10K
Goan Konkani
- Newscrawl
  - 2011 10K
  - 2011 30K
- Wikipedia
Guarani
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Gujarati
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2014 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Haitian
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2012 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
  - 2021 30K
- Haiti
  - Web
Hausa
- Wikipedia
  - 2021 10K
  - 2021 30K
Hebrew
- News
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Hindi
- News
  - 2007 10K
  - 2007 30K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Hungarian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- COM
  - Web
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Hungary
  - Web
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
- Romania
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Slovakia
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
Icelandic
- News
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Iceland
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Ido
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
Igbo
- Wikipedia
  - 2021 10K
Iloko
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Indonesian
- News
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Newscrawl-tufs5
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl-tufs6
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Brunei
  - Web
    - 2015 10K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Interlingua
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Interlingue
- Wikipedia
  - 2018 10K
  - 2021 10K
Iranian Persian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Iran
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
Irish
- Newscrawl
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Italian
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2005-2009 10K
  - 2005-2009 30K
  - 2005-2009 100K
  - 2005-2009 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 100K
  - 2012 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- San Marino
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Switzerland
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
    - 2023 10K
    - 2023 30K
    - 2023 100K
    - 2023 300K
Japanese
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2005-2008 10K
  - 2005-2008 30K
  - 2005-2008 100K
  - 2005-2008 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2021 10K
  - 2023 10K
  - 2023 30K
  - 2023 100K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Japan
  - Web
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Javanese
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- BMS
  - Wikipedia
    - 2016 10K
    - 2021 10K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
Kabiyè
- Wikipedia
  - 2018 10K
  - 2021 10K
Kalaallisut
- Newscrawl
  - 2011 10K
  - 2011 30K
- Greenland
  - Web
    - 2014 10K
    - 2014 30K
Kannada
- Newscrawl
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Karachay-Balkar
- Wikipedia
Kashubian
- Wikipedia
Kazakh
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Kazakhstan
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Kirghiz
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Komi
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Komi-Permyak
- Wikipedia
Konkani
- India
  - Web
    - 2015 10K
Korean
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Korea, South
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Kurdish
- Newscrawl
  - 2011 10K
  - 2011 30K
Kölsch
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Ladino
- Wikipedia
  - 2018 10K
  - 2021 10K
Latin
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Latvian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Latvia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Lezghian
- Wikipedia
  - 2018 10K
Ligurian
- Wikipedia
  - 2021 10K
Limburgan
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Netherlands
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Lithuanian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- LIT
  - News
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Lithuania
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Lombard
- Wikipedia
  - 2010 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Low German
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Netherlands
  - Wikipedia
    - 2016 10K
    - 2021 10K
Lower Sorbian
- Wikipedia
  - 2016 10K
  - 2018 10K
Lushai
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2015 10K
    - 2015 30K
Luxembourgish
- Newscrawl
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Luxembourg
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Macedonian
- News
  - 2019 10K
  - 2019 30K
  - 2020 10K
  - 2020 30K
  - 2020 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Macedonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Madurese
- Indonesia
  - Web
    - 2013 10K
Maithili
- Wikipedia
  - 2018 10K
  - 2021 10K
Malagasy
- Web
  - 2012 10K
  - 2012 30K
- Wikipedia
Malay
- News
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Newscrawl-tufs5
  - 2011 10K
- Newscrawl-tufs6
  - 2012 10K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- India
  - Web
- Malaysia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
Malayalam
- Newscrawl
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Maltese
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2012 10K
  - 2012 30K
  - 2012 100K
- Web
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2010 10K
  - 2012 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Mandarin Chinese
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- China, Republic of (Taiwan)
  - Web
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- TRAD
  - Wikipedia
    - 2018 10K
    - 2018 30K
Manx
- Wikipedia
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Maori
- Web
- New Zealand
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2017 10K
    - 2017 30K
    - 2017 100K
Marathi
- News
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Mazanderani
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Min Nan Chinese
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
Minangkabau
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Indonesia
  - Web
    - 2013 10K
Mingrelian
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Mirandese
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Modern Greek
- News
  - 2007 10K
  - 2007 30K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Greece
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Mongolian
- News
  - 2011 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
- Newscrawl
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Navajo
- Wikipedia
  - 2018 10K
  - 2021 10K
Neapolitan
- TARA
  - Wikipedia
    - 2021 10K
Nepali
- News
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Nepal
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Newari
- Wikipedia
  - 2009 10K
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
North Azerbaijani
- Wikipedia
  - 2007 10K
- Azerbaijan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Northern Frisian
- Wikipedia
Northern Sami
- Wikipedia
  - 2018 10K
  - 2021 10K
- Norway
  - News
    - 2015 10K
  - Web
    - 2013 10K
Northern Uzbek
- Uzbekistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Norwegian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Norwegian Bokmål
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Newscrawl
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- European Union
  - Web
- Norway
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Norwegian Nynorsk
- Newscrawl
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Norway
  - Web
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Occitan
- Wikipedia
  - 2007 10K
  - 2012 10K
  - 2012 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- France
  - Web
    - 2020 10K
Oriya
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Oromo
- Wikipedia
  - 2021 10K
Ossetian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Pampanga
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
Panjabi
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- India
  - Web
Papiamento
- News
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
Pedi
- South Africa
  - Web
    - 2018 10K
    - 2020 10K
Persian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2012 10K
  - 2012 30K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Iran
  - Web
Pfaelzisch
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Piemontese
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2012 10K
  - 2012 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Plateau Malagasy
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Polish
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Portuguese
- News
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Brazil
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Cape Verde
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- European Union
  - Web
- Luxembourg
  - Web
- Macau
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Mozambique
  - Web
- Netherlands Antilles
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Portugal
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Pushto
- News
- Newscrawl
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Quechua
- Wikipedia
  - 2011 10K
  - 2012 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Romanian
- News
  - 1998-2007 10K
  - 1998-2007 30K
  - 1998-2007 100K
  - 1998-2007 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Moldova
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Romania
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Romansh
- Newscrawl
  - 2016 10K
  - 2016 30K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
- Switzerland
  - Web
    - 2015 10K
    - 2016 10K
    - 2016 30K
    - 2017 10K
    - 2017 30K
    - 2017 100K
Russian
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl-public
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Azerbaijan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Estonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Georgia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Kazakhstan
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Kyrgyzstan
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Latvia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Lithuania
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Moldova
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- SU
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Tajikistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Tuvalu
  - Web
    - 2015 10K
    - 2015 30K
- Ukraine
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Uzbekistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Rusyn
- Wikipedia
  - 2018 10K
  - 2021 10K
- Ukraine
  - Web
    - 2016 10K
Sami
- News
  - 2020 10K
Samogitian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Sanskrit
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Sardinian
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Saterfriesisch
- Wikipedia
  - 2018 10K
Scots
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Serbian
- News
  - 2019 10K
  - 2019 30K
  - 2020 10K
  - 2022 10K
  - 2022 30K
  - 2023 10K
  - 2023 30K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Bosnia and Herzegovina
  - Web
- Montenegro
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Serbia
  - Web
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Serbo-Croatian
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Bosnia and Herzegovina
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
  - Wikipedia
    - 2007 10K
    - 2007 30K
    - 2007 100K
    - 2014 10K
    - 2014 30K
    - 2014 100K
- Croatia
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Wikipedia
    - 2007 10K
    - 2007 30K
    - 2007 100K
    - 2007 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- European Union
  - Web
- Serbia
  - News
    - 2007 10K
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Wikipedia
    - 2007 10K
    - 2007 30K
    - 2007 100K
    - 2007 300K
    - 2010 10K
    - 2010 30K
    - 2010 100K
    - 2010 300K
Shona
- Web
  - 2012 10K
  - 2012 30K
- Zimbabwe
  - Newscrawl
    - 2013 10K
    - 2013 30K
  - Web
    - 2013 10K
    - 2015 10K
    - 2016 10K
    - 2016 30K
    - 2018 10K
    - 2018 30K
    - 2018 100K
Sicilian
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Silesian
- Wikipedia
  - 2016 10K
  - 2018 10K
  - 2021 10K
  - 2021 30K
Sindhi
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Sinhala
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Slovak
- News
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Slovakia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Slovenian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
- Slovenia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Somali
- News
  - 2020 10K
- Newscrawl
- Wikipedia
Southern Sotho
- South Africa
  - Web
    - 2015 10K
    - 2018 10K
Spanish
- News
  - 2001-2002 10K
  - 2001-2002 30K
  - 2001-2002 100K
  - 2001-2002 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
  - 2024 10K
  - 2024 30K
  - 2024 100K
  - 2024 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Newscrawl-public
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Andorra
  - Web
    - 2013 10K
    - 2013 30K
    - 2017 10K
    - 2017 30K
    - 2017 100K
- Argentina
  - Web
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Bolivia
  - Web
    - 2015 10K
- Colombia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Costa Rica
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Cuba
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Dominican Republic
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Ecuador
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- El Salvador
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Guatemala
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Honduras
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Mexico
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Nicaragua
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Panama
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Paraguay
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Peru
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Puerto Rico
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- United States
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Uruguay
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Venezuela
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Standard Estonian
- Web
  - 2011 10K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Standard Latvian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Standard Malay
- Newscrawl-tufs15
Sundanese
- Wikipedia
  - 2007 10K
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
Swahili
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2011 10K
  - 2011 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Swati
- South Africa
  - Web
    - 2020 10K
Swedish
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Sweden
  - Web
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Swiss German
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Switzerland
  - Web
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
Tagalog
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2007 10K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Tajik
- Newscrawl
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Tajikistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Uzbekistan
  - Web
    - 2015 10K
Tamil
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Sri Lanka
  - Web
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Tatar
- News
- Web
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Telugu
- News
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Thai
- Newscrawl
  - 2011 10K
  - 2011 30K
- Wikipedia
  - 2016 10K
- Thailand
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 100K
Tosk Albanian
- Wikipedia
  - 2007 10K
  - 2007 30K
- Albania
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- SQI
  - News
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Tsonga
- South Africa
  - Web
    - 2018 10K
    - 2020 10K
Tswana
- Botswana
  - Web
    - 2018 10K
- South Africa
  - Web
    - 2020 10K
Tulu
- Wikipedia
  - 2018 10K
Turkish
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Bulgaria
  - Web
    - 2015 10K
    - 2015 30K
- Cyprus
  - Web
- European Union
  - Web
    - 2014 10K
    - 2014 30K
- Turkey
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
Turkmen
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
- Turkmenistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
Tuvinian
- Wikipedia
Udmurt
- Wikipedia
  - 2016 10K
  - 2018 10K
Uighur
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Ukrainian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
- Ukraine
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2019 100K
    - 2019 300K
Upper Sorbian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
Urdu
- News
  - 2007 10K
  - 2007 30K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2019 10K
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Pakistan
  - Newscrawl
    - 2012 10K
Uzbek
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Venda
- South Africa
  - Web
    - 2020 10K
Venetian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2018 10K
  - 2021 10K
  - 2021 30K
- Brazil
  - Web
    - 2015 10K
    - 2015 30K
- Croatia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2015 10K
    - 2015 30K
    - 2015 100K
Vietnamese
- News
  - 2007 10K
  - 2007 30K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Cambodia
  - Web
    - 2013 10K
- Vietnam
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Vlaams
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Volapük
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Võro
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Walloon
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Waray (Philippines)
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
Welsh
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Western Frisian
- News
- Newscrawl
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Western Mari
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Western Panjabi
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Wu Chinese
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Xhosa
- South Africa
  - Web
    - 2015 10K
    - 2018 10K
    - 2018 30K
    - 2020 10K
    - 2020 30K
Yakut
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Yiddish
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Yoruba
- Wikipedia
Yue Chinese
- Wikipedia
Zeeuws
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Zulu
- Mixed
  - 2014 100K
- News
  - 2013 10K
  - 2013 30K
- Web
  - 2012 10K
  - 2013 10K
  - 2013 30K
  - 2013 100K
- South Africa
  - Web
    - 2013 10K
    - 2015 10K
    - 2015 30K
    - 2018 10K
    - 2018 30K
    - 2020 10K
    - 2020 30K
    - 2020 100K

5.1.6 Language Fingerprint

NN Co-occurrences of the Top-1000 Words

NN Co-occurrences of the Top-10 Words

Left Nb.	Right Nb.	Frequency
է	որ	32
է	էլ	4
է	թե	36
է	ու	237
է	եւ	477
որ	է	7
որ	որ	3
որ	եւ	4
որ	էլ	11
որ	թե	21
որ	մի	132
որ	այդ	541
են	որ	5
են	թե	12
են	եւ	197
են	ու	127
են	այդ	187
եւ	որ	37
եւ	էլ	3
եւ	թե	32
եւ	այդ	197
ու	որ	5
ու	էլ	7
ու	այդ	36
ու	մի	85
էլ	եւ	4
էլ	որ	35
էլ	ու	7
էլ	է	212
էլ	թե	9

Gnuplot diagram

133 msec needed at 2018-03-09 07:43